前言
之前有业务场景需要批量插入数据到Redis中,做的过程中也有一些感悟,因此记录下来,以防忘记。下面的内容会涉及到
-
分别使用for、管道处理批量操作,比较其所花费时间。
-
分别使用RedisCallback、SessionCallback进行Redis pipeline 操作
-
解释RedisCallback、SessionCallback这两种用法的区别
管道(pipeline)的优势
以下内容结合了redis官方文档,总结出自己的想法。
Redis Pipeline官网地址:https://redis.io/docs/manual/pipelining/
1.网络传输(RTT)开销少
Redis的传输层是基于TCP协议,一次操作请求的完成,存在网络传输来回的开销,即使Redis每秒能接受10万的请求,但也会因为网络传输而浪费很多时间,导致降低整体的性能。所以面对大量的批量处理,可以使用Redis的管道(pipeline),优势在于多次指令操作只会使用一次的网络传输的开销。
PS:像批量插入、批量获取,RedisTemplate提供了multiSet、multiGet的方法可以进行操作,不过像multiSet并不支持批量设置key的过期时间,可以考虑业务场景进行使用
2.提高redis每秒可以执行操作的数量
在进行批量操作的前提下
不使用管道的时候,每一次Redis执行命令,都要涉及到读(read)和写(write)的系统调用,系统会将用户端切换到内核端。上下文切换会有一定的消耗使用管道的话,多条命令只需要一个读(read),多条响应只需要一个写(write),可想而知,这其中省下了很多的消耗。
环境配置
-
JDK8
-
Spring boot 2.6.13
-
spring-boot-starter-data-redis
分别使用for、管道处理批量操作,比较其所花费时间
public void testForOrPipeline(){ //使用for StopWatch stopWatch2=new StopWatch(); stopWatch2.start(); for(int i=0;i<10000;i++){ String value = String.valueOf(i); String key = "test:" + value; redisTemplate.opsForValue().set(key, value, 10, TimeUnit.SECONDS); } stopWatch2.stop(); System.out.println("for所需时间:"+stopWatch2.getTotalTimeSeconds()+"s"); //使用管道 StopWatch stopWatch3=new StopWatch(); stopWatch3.start(); List<Boolean> list = redisTemplate.executePipelined(new SessionCallback<Object>() { @Override public Object execute(RedisOperations operations) throws DataAccessException { for (int i = 0; i < 10000; i++) { String value = String.valueOf(i); String key = "test:" + value; operations.opsForValue().set(key, value, 10, TimeUnit.SECONDS); } return null; } }); stopWatch3.stop(); System.out.println("管道所需时间:"+stopWatch3.getTotalTimeSeconds()+"s");}
方法 | 第一次 | 第二次 | 第三次 | 第四次 |
---|---|---|---|---|
for | 3.07s | 3.07s | 3.13s | 3.12s |
pipeline | 0.55s | 0.63s | 0.60s | 0.68s |
PS: 本地,且只有一个客户端的情况下测试(做不到严谨性,见谅)
目前只是本地跑(网络传输所带来的开销本身会很小),如果redis服务端是在其他地区的服务器上,这两种方式所需的时间相差还会越来越大。
分别使用RedisCallback、SessionCallback进行Redis pipeline 操作
RedisCallback
private void RedisCallBackHandler() { //这里获取String类型的序列化器 RedisSerializer stringSerializer = redisTemplate.getStringSerializer(); //第二个参数是指定结果反序列化器,用于反序列化管道中读到的数据,不是必传, //如果不传,则使用自定义RedisTemplate的配置, //如果没有自定义,则使用RedisTemplate默认的配置(JDK反序列化) List list = redisTemplate.executePipelined(new RedisCallback<Object>() { @Override public Object doInRedis(RedisConnection connection) throws DataAccessException { for (int i = 0; i < 10; i++) { String value = String.valueOf(i); String key="test:"+value; connection.setEx(stringSerializer.serialize(key),10,stringSerializer.serialize(value)); } //这里bytes只会获取到null,因为这里get操作只是放在管道里面,并没有 //真正执行,所以获取不到值 //byte[] bytes = connection.get("test:1".getBytes()); connection.get("test:1".getBytes()); //executePipelined 这个方法需要返回值为null,不然会抛异常, //这一点可以查看executePipelined源码 return null; } }, stringSerializer); list.stream().forEach(result->{ System.out.println(result); });}
执行结果:
SessionCallback
private void SessionCallBackHandler() { //这里获取String类型的序列化 RedisSerializer stringSerializer = redisTemplate.getStringSerializer(); //第二个参数是指定结果反序列化器,用于反序列化管道中读到的数据,不是必传, //如果不传,则使用自定义RedisTemplate的配置, //如果没有自定义,则使用RedisTemplate默认的配置(JDK反序列化) List list = redisTemplate.executePipelined(new SessionCallback<Object>() { @Override public Object execute(RedisOperations operations) throws DataAccessException { for (int i = 0; i < 10; i++) { String value = String.valueOf(i); String key = "test:" + value; operations.opsForValue().set(key, value, 10, TimeUnit.SECONDS); } //这里o只会获取到null,因为这里get操作只是放在管道里面,并没有真正执行,所以获取不到值 //Object o = operations.opsForValue().get("test:1"); operations.opsForValue().get("test:1"); //executePipelined 这个方法需要返回值为null,不然会抛异常, //这一点可以查看executePipelined源码 return null; } }, stringSerializer); list.stream().forEach(result->{ System.out.println(result); });}
执行结果:
解释RedisCallback、SessionCallback这两种用法的区别
上面代码显示了RedisCallback、SessionCallback这两种都能实现相同的效果,那么这两个又有什么区别呢?
SessionCallback 的使用比RedisCallback要友好一些
SessionCallback的execute方法提供给使用者使用的是RedisOperations接口类,RedisTemplate实现类
RedisCallback的doInRedis方法提供给使用者使用的是RedisConnection接口类,也就是LettuceConnection是实现类
RedisConnection提供了字节数组类型的get和set方法,有关序列化部分的细节还需要我们去关心。(和使用原生jdbc感受差不多),而RedisTemplate负责序列化和连接管理,不需要让使用者关系这一块的部分。总结: 个人感觉从日常使用上应该都倾向于SessionCallback,而个别特殊有关底层的业务,可能就需要RedisCallback。